رفع اختلاف مقادیر داده ای میان موجودیت های همانند در وب داده ها
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی
- author مژگان عسکریزاده
- adviser محمد علی نعمت بخش
- Number of pages: First 15 pages
- publication year 1391
abstract
وب داده های پیوندی به سرعت در حال گسترش می باشد و در حال حاضر شامل داده هایی از صدها مجموعه داده ی متفاوت می باشد. کیفیت داده های این مجموعه داده ها بسیار متغیر است، به طوریکه ممکن است این داده ها قدیمی، ناقص و یا نادرست باشند. از طرف دیگر امکان دارد مجموعه داده ها اطلاعات متناقضی درمورد یک موجودیت واحد در جهان واقعی ارائه کنند. به منظور استفاده ی برنامه های کاربردی داده های پیوندی از این فضای سراسری داده ها، چالش هایی بوجود آمده است. یکی از این چالش ها رفع اختلاف مقادیر داده ای است، در شرایطی که مجموعه داده های مختلف مقادیر متفاوتی برای یک موجودیت یکسان در جهان واقعی در نظر گرفته اند. در این تحقیق الگوریتمی ارائه شده است تا صحیح ترین مقدار از بین مقادیر موجود انتخاب شود تا بدین صورت اختلاف بین مقادیر برطرف شود. الگوریتم ارائه شده از چهار بخش اصلی تشکیل شده است که شامل مراحل فیلترگذاری، تشخیص تکراری ها، بررسی آنتولوژی و بررسی اندازه می باشد. داده ها از یک دامنه دانش و از مجموعه داده های مختلف استخراج می شوند و به عنوان ورودی به الگوریتم داده می شود و در نهایت بهترین مقادیر برای خصوصیات یک موجودیت انتخاب می شود الگوریتم پیشنهادی با استفاده از زبان برنامه نویسی جاوا پیاده سازی و سپس روی مجموعه داده های متعلق به دامنه ی فیلم و مناطق جغرافیایی تست و ارزیابی گردیده است. نتایج بدست آمده در این دو دامنه دانش متفاوت می باشد و به کیفیت داده های منتشر شده وابسته است.
similar resources
شناسایی موجودیت های همانند در وب داده
وب داده به منظور ایجاد وب قابل فهم برای ماشین ها معرفی شده است که اتصالات معنادار بین موجودیت ها از ویژگی های اصلی آن است. یکی از مهم ترین اتصالات معنادار در وب داده، اتصالات همانندی است که بین موجودیت های همانند ایجاد می شود. شناسایی و اتصال موجودیت هایی که به یک موجودیت یکسان اشاره می کنند ولی دارای شناسه های یکتای منبع متفاوت هستند و در مجموعه داده های مختلفی قرار دارند، موجب می شود عامل ها ...
15 صفحه اولرتبه بندی موجودیت در وب داده
امروزه، موتورهای جستجو به یکی از برنامه های کاربردی بسیار مهمِ وب تبدیل شده اند که هدف آن ها کمک به کاربر در جهت یافتن اطلاعات است. موتورهای جستجو همچون گوگل و یاهو کلمات کلیدی کاربر را دریافت می کنند و در صفحات وب بر اساس الگوریتم های از قبل تعریف شده به دنبال کلمات کلیدی وارد شده می گردند. سپس صفحات بازیابی شده را بر اساس الگوریتم رتبه بندی، مرتب و به کاربر نشان می دهند. با ظهور فناوری وب مع...
15 صفحه اولمقایسه عناصر داده ای مجموعۀ حداقل داده های پرستاری
چکیده مقدمه: دادهپردازی استاندارد نقش مهمی در مراقبت از بیمار ایفا میکند. دادههای پرستاری، سطح اولیه انفورماتیک پرستاری را تشکیل میدهند. این دادهها، ابزار اصلی مورد استفاده برای ثبت شرح دقیق فرایند پرستاری از طریق روششناسی ارزشیابی، تشخیصها، مداخلات، پیامدها، مستندسازی و ارزیابی مراقبت بیمار هستند. همچنین نخستین اقدام برای استاندارد کردن جمعآوری دادههای یکسان و ضروری پرستاری برای ا...
full textخوشه بندی موجودیت ها در داده های پیوندی
وب معنایی شامل قرار دادن داده ها روی وب و ساختن ارتباطات به گونه ای است که انسان و ماشین بتوانند محتوای وب داده را کاوش نمایند. هدف وب معنایی افزایش توانایی ماشین ها در دسترسی به منابع موجود در وب، پردازش و بکارگیری آن ها می باشد. با توجه به رشد گسترده ی داده های پیوندی و افزایش مجموعه داده ها در چند سال اخیر، نیاز به ابزاری برای کشف پیوند در مقیاس وسیع احساس می شود. ابزارهای کنونی برای کشف پیو...
15 صفحه اولارائه راهکاری جهت تجمیع داده ها در سازمانها با استفاده از وب سرویس
Increasing the speed and reducing the use of resources in the data integration process has always been the goal of developers and researchers in the process of data integration. The purpose of this study is to provide a solution using metadata as well as web browsing to speed up the process, so as to improve resources such as memory. The proposed solution is implemented using the three-layer ar...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023